伺服器的程式執行數量監控

     "執行程式"是伺服器的作業系統與應用系統最重要的應用存活指標

     "執行程式"是伺服器本體維運監控的一類監控項目
     監控伺服器的"執行程式"是統計指定的程式名稱,目前所執行的程序數量,以程序數量來定義正常或異常狀態

     "執行程式"最常使用的應用面
       [低於程式最少執行數量]
          *.服務未啟用
          *.應用程式異常而自行中止(如:core dump)
          *.應用程式遭中止(kill)

       [高於程式最大執行數量]
          *.應用程式重複啟用而衝突
          *.應用程式啟用太多而影響主機效能或未正常停止執行





     伺服主機的維運管理分為硬體層,作業系統層以及應用系統層
     應用系統層是專屬這台主機的主項功能,而應用程式的啟用執行狀態也是關鍵這台伺服器的存活指標
     例如:網站伺服器常用的IIS或是Apache等,啟用系統服務會帶起必要的背景程式執行
     而背景程式的執行數量也會有限制,依照程式特性有時候僅能容許一支程式執行或是可以容許數支程式同時執行

     如果使用"執行程式"功能,即可以充分掌握應用系統層的目標程式運作狀況
     並且避免重複執行的程式太多造成系統消耗過大,或是應該運作的程式沒有執行,造成服務中斷的狀況
     協助維運人員作到Debug與管理的全面掌握

     點選進入伺服主機偵測狀態之後,點選執行程式功能的圖示連結即可進入,如下圖:



     監控"執行程式"的系統規格

       偵測目的: 定時檢測必須執行之程式數量,用於程式中止未執行或重復執行太多與LISTEN服務程式啟用
                     如: FTP client 傳送,若卡死,則FTP程式的數量會增加很多
       監測目標: 程式名稱
       警報條件: 最低執行數量/最高執行數量
       即時資訊: 數據/警報發佈
       資訊收集: 訊息,數據,警報發佈/解除時間點
       緊急處置: 通報,執行預定程式
       警報臨界值: 依程式特性定義警報值

     "執行程式"監控項目的警報臨界值有下列兩項
       *.程式最少執行數量
       *.程式最大執行數量




     上圖為Watchdog系統執行程式功能的主偵測畫面

     偵測畫面可以清楚的顯示該程式的執行數量,當執行程式出現警報狀況
     提供正確的時間點協助維運人員以追蹤發生狀況的原因
     長期收集的資訊,參考用於分析應用系統平常的運作狀況等作用

     下圖即為長短期偵測的選擇點選畫面:



     點選進去可以選擇長短期的偵測效能或是警報分析等資訊.



     短期資訊有效範圍選擇.

     下圖分別為短期的效能分析與警報分析圖表




     下圖的執行程式一週的警報分析圖可以看到04/21(星期四),分別在02點到03點
     以及06點左右有發生執行程式出現警報的狀況,可以協助維運人員以正確的時間點追蹤發生狀況的原因






     上圖為長期的效能分析報表

     設定"執行程式"的功能,請由在偵測名單中點選伺服主機之後,點選偵測項目內的執行程式文字連結即可

     共通的通用功能的欄位例如:序號,起用,刪除,警報與群組別名等等的功能,請參閱通用功能說明

     設定欄位請參閱下圖
       1.最低:輸入偵測目標最小的執行數量(初值為1,可設定範圍=0~9999),若低於警戒值,則發出告警並且執行警報程序
       2.最高:輸入偵測目標最大的執行數量(初值為1,可設定範圍=0~9999),若高於警戒值,則發出告警並且執行警報程序
       3.偵測目標:主要為輸入偵測目標的程式名稱.






回到首頁